FuriosaAI y Broadcom unirán fuerzas para crear chips de IA más potentes y escalables

por Juan Antonio Soto Ayer a las 15:00

Para abordar la próxima generación de tareas de Inteligencia Artificial, los fabricantes están realizando colaboraciones estratégicas para unir no solo sus fuerzas, sino su experiencia y conocimientos en cada área. Una asociación como la que ha realizado FuriosaAI y Broadcom, con la que pretenden construir una plataforma de inferencia de próxima generación y desarrollar así su chip acelerador de IA de tercera generación. Ahora la arquitectura TCP de Furiosa pasará a ser un sistema de chiplets con varias baldosas.

FuriosaAI y Broadcom colaboran para desarrollar una nueva plataforma de inferencia para IA

FuriosaAI, fabricante de silicio para inferencia de alto rendimiento, colaborará con Broadcom para el desarrollo de este nuevo acelerador para IA. Con esta fusión se pretende abordar los requisitos de tokens de alto volumen para los entornos escalables, con la combinación de la arquitectura de IA de Furiosa y la experiencia en soluciones de redes para IA de Broadcom, donde también cuenta con soluciones de alto ancho de banda ideales para este tipo de datos.

El objetivo es escalar clústeres de IA a miles de nodos con redes de alta velocidad

La idea es escalar los clústeres dedicados para IA a miles de nodos a través de la red de alta velocidad. Para esto se aprovechará el chip para inferencia de FuriosaAI RNGD, que actualmente se encuentra en fabricación en masa con un nodo de 5 nm de TSMC. Este acelerador PCIe está diseñado para ofrecer un alto rendimiento en cargas de trabajo de IA automatizada, y también para los LLM más exigentes.

El alto rendimiento y un consumo de solo 180 W, junto con la baja latencia, se puede conjuntar con las soluciones de Broadcom para esta próxima generación de la plataforma. La idea es que la comunicación entre diferentes servidores y rack sea más eficiente y rápida, combinando la arquitectura TCP de Furiosa con la tecnología XPU de Broadcom.

La tercera generación apostará por 2 nm y memoria HBM4/HBM4E

La tercera generación llevará el chip de Furiosa hasta los 2 nm, e incorporará memoria HBM4 o HBM4E de doble capa. También se aprovechará el empaquetado avanzado de Broadcom, que permitirá añadir varios chips dentro del mismo silicio, integrando tecnologías Ethernet y PCIe para mejorar la conectividad y el ancho de banda, tan necesario entre diferentes clústeres.

Más rendimiento, escalabilidad y un SDK pensado para simplificar el desarrollo

La fusión se llevará a cabo para ofrecer un rendimiento mejorado ante cargas de tareas más exigentes, como las que se esperan en la próxima generación de IA. También para llevar este rendimiento a la escalabilidad, para distribuir las tareas entre diferentes nodos, que gestionarán de forma más eficiente los tokens.

Para acompañar a este potente hardware, también se cuenta con un paquete de software para que los desarrolladores puedan implementar sus soluciones de forma rápida y sencilla. El SDK de Furiosa lo pone fácil, ofreciendo un compilador general para asignar el código a PyTorch en lugar de realizar dificultosos ajustes manuales. Una programación menos compleja que la tradicional utilizada para gestionar las GPUs.

Fin del Artículo. ¡Cuéntanos algo en los Comentarios!